ما يقرب من نصف لغات العالم المعروفة التي يبلغ عددها 7000 لغة أربعة من كل عشر لغات موجودة بدون أي مكون مكتوب مصاحب. تشكل هذه اللغات غير المكتوبة مشكلة فريدة لأنظمة الترجمة الحديثة للتعلم الآلي ، حيث تحتاج عادةً إلى تحويل الكلام اللفظي إلى كلمات مكتوبة قبل الترجمة إلى اللغة الجديدة وإعادة النص إلى الكلام ، ولكن يقال إن Meta قد عالجته بأحدث فتح له -تطوير الذكاء الاصطناعي للغة المصدر.
كجزء من برنامج Meta Universal Speech Translator (UST) الذي يعمل على تطوير ترجمة الكلام إلى كلام في الوقت الفعلي بحيثسكان ميتافيرسيمكن أن تتفاعل بسهولة أكبر (اقرأ:التحرش الجنسي ببعضهم البعض). كجزء من هذا المشروع ، نظر باحثو Meta في Hokkien ، وهي لغة غير مكتوبة يتم التحدث بها في جميع أنحاء آسيا في الشتات وإحدى اللغات الرسمية في تايوان.
يمكن لمترجم Meta AI ترجمة اللغات غير المكتوبة
يترجم حاليًا بين اللغة الإنجليزية و Hokkien.
صورة مقربة لشباب آسيا في سن المراهقة فتاة سعيدة تجلس وتسترخي في المكالمة ، استخدم دردشة الهاتف الذكي ، أرسل نصًا إلى 5G wifi mic VoIP deep tech ai bot app في المنزل. استمتع بالترتيب الصوتي لمساعدة chatbot iot على وسائل التواصل الاجتماعي.
Chaay_Tee عبر Getty Images
ما يقرب من نصف لغات العالم المعروفة التي يبلغ عددها 7000 لغة أربعة من كل عشر لغات موجودة بدون أي مكون مكتوب مصاحب. تشكل هذه اللغات غير المكتوبة مشكلة فريدة لأنظمة الترجمة الحديثة للتعلم الآلي ، حيث تحتاج عادةً إلى تحويل الكلام اللفظي إلى كلمات مكتوبة قبل الترجمة إلى اللغة الجديدة وإعادة النص إلى الكلام ، ولكن يقال إن Meta قد عالجته بأحدث فتح له -تطوير الذكاء الاصطناعي للغة المصدر.
كجزء من برنامج Meta Universal Speech Translator (UST) الذي يعمل على تطوير ترجمة الكلام إلى كلام في الوقت الفعلي بحيثسكان ميتافيرسيمكن أن تتفاعل بسهولة أكبر (اقرأ:التحرش الجنسي ببعضهم البعض). كجزء من هذا المشروع ، نظر باحثو Meta في Hokkien ، وهي لغة غير مكتوبة يتم التحدث بها في جميع أنحاء آسيا في الشتات وإحدى اللغات الرسمية في تايوان.
تتطلب أنظمة ترجمة التعلم الآلي عادةً أمثلة موسعة قابلة للتوسيم للغة ، سواء كانت مكتوبة أو منطوقة ، للتدريب عليها - على وجه التحديد ما لا تملكه اللغات غير المكتوبة مثل Hokkien. للتغلب على ذلك ، "استخدمنا ترجمة الكلام إلى وحدة (S2UT) لتحويل كلام الإدخال إلى سلسلة من الوحدات الصوتية مباشرة في المسار الذي كانت شركة Meta رائدة فيه سابقًا" ، أوضح الرئيس التنفيذي مارك زوكربيرج في منشور يوم الأربعاء على المدونة. ثم قمنا بتوليد أشكال موجة من الوحدات. بالإضافة إلى ذلك ، تم اعتماد UnitY لآلية فك التشفير ذات المسارين حيث تقوم وحدة فك ترميز المرور الأول بإنشاء نص بلغة ذات صلة (الماندرين) ، ويقوم وحدة فك ترميز المرور الثاني بإنشاء وحدات. "
"لقد استفدنا من لغة الماندرين كلغة وسيطة لبناء تسميات زائفة ، حيث قمنا أولاً بترجمة خطاب اللغة الإنجليزية (أو Hokkien) إلى نص الماندرين ، ثم ترجمنا إلى Hokkien (أو الإنجليزية) وأضفناه إلى بيانات التدريب" ، تابع. في الوقت الحالي ، يسمح النظام للشخص الذي يتحدث هوكين بالتحدث مع شخص يتحدث الإنجليزية ، وإن كان ذلك متوقفًا. يمكن للنموذج ترجمة جملة كاملة واحدة فقط في كل مرة ، لكن زوكربيرج واثق من أنه يمكن تطبيق التقنية في النهاية على المزيد من اللغات وستتحسن إلى درجة تقديم الترجمة في الوقت الفعلي.
بالإضافة إلى النماذج وبيانات التدريب التي تعد Meta مصدرًا مفتوحًا لها بالفعل من هذا المشروع ، تقوم الشركة أيضًا بإصدار أول نظام لقياس أداء ترجمة الكلام إلى كلام يعتمد على مجموعة الكلام Hokkien المسمى التايوانية عبر تايوان أعلن زوكربيرج ، بالإضافة إلى "مصفوفة الكلام ، مجموعة كبيرة من ترجمات تحويل الكلام إلى كلام تم استخراجها باستخدام تقنية Meta المبتكرة لاستخراج البيانات المسماة LASER". سيمكن هذا النظام الباحثين من إنشاء أنظمة ترجمة الكلام إلى كلام (S2ST) الخاصة بهم.